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Prufungsantrag gem. § 44 PatG ist gesteilt 

@ Verfahren zur sichtbaren Darstellung von Ergebnissen der Leistungsuberwachung und -Analyse in einem 
Parallelrechnersystem 

(g) Es wird ein Verfahren der sichtbaren Darstellung von 

Ergebnissen der Leistungsuberwachung und -analyse fur ein 

Parallelrechnersystem beschrieben, bei dem eine Vielzahl 

von Prozessoren ein parallel verarbeitendes Programm aus- 

fuhren, welches aus einer Vielzahl von Routinen zusammen- 

gesetzt ist. Zuerst werden Informationen hinsichtlich der 

Ausfuhrungszeit von jeder Routine in einer Realzeitweise 

gesammelt, wahrend das Programm gleichlaufend durch die 

Vielzahl von Prozessoren ausgefuhrt wird. Zweitens werden 

Maximal-, Mittel- und Minimalwerte der Ausfuhrungszeit 

von jeder Routine berechnet, basierend auf den Informatio- 
nen, die fur die Vielzahl der Prozessoren gesammelt wurden. 

Drittens werden die gesammelten Infprmationen in Form 

eines Ausfuhrungsprofils zusammengefaBt oder summiert 
^ und werden in graphischer Form dargestelit, und zwar unter 

Verwendung von Balkengraphiken, Kreisgraphiken oder Ra- 

darkarten. Fur jede Prozedur oder Prog ram mschleife klassifi- 
lO ziert das vorfiegende Verfahren die Prozentsatze der Anwen- 
^1 der-Netto-Programmausfuhrung, Kommunikation, Synchro- 
^} nisation und anderer parallel laufender Zusatzaufgaben, und 
^ zeigt auch deren Abweichungen an. Dieses Merkmal unter- 
^ stutzt den Anwender darin, das aktuelle Programmverhalten 
0> zu verstehen und das parallel verarbeitende Programm 
^ abzustimmen. 
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HINTERGRUND DER ERFINDUNG 
1. Gebiet der Erfindung 

Die vorliegende Erfindung betrifft ein Verfahren zur sichtbaren DarsteUung von Ergebnissen der Leistungs- 
uberwachung und -analyse in einem Parallelrechnersystem, welches eine Vielzahl von Prozessoren verwendet, 
und betrifft spezieller ein Verfahren zur sichtbaren DarsteUung von Ergebnissen der Leistungsuberwachung und 
-analyse in einer bedienungskomfortableren und umfassenden Weise. Die vorliegende Erfindung betrifft auch 
ein computer-lesbares Medium, welches mit einem Computerprogramm codiert ist, bei welchem das zuvor 
genannte Verfahren realisiert wird 

2. Beschreibung des verwandten Standes der Technik 

Parallele Verarbeitungstechniken spielen eine entscheidende Rolle bei der Befriedigung von heutzutage 
wachsenden Anforderungen nach Hochleistungsrechnersystemea Ein Parallelrechnersystem fuhrt eine Anwen- 
dung aus, indem es eine Vielzahl von Prozessoren verwendet, die parallel laufen, wodurch ein hoher Verarbei- 

20 tungsdurchgang erzielt wird Die Entwicklung von Software fur ein Parallelrechnersystem bringt jedoch im 
allgemeinen einige Schwierigkeiten bei der Programmaustestung, Bewertung und Leistungsabstimmung mit 
sich,undzwaraufgrundderenkomplexerNatur. 

Urn das Problem zu losen, werden Leistungsanalysierer als ein gunstiges Werkzeug emgefuhrt, welches die 
Software-Programmierer darin unterstutzt, das Verhalten eines Paralleiprogramms beim Testen zu uberwachen 

25 und dessen Leistung zu messen. Der Analysierer verarbeitet die gesammelten Daten und prasentiert das 
Ergebnis dem Anwender in Form eines aufsummierten Ausfuhrungsprofils. 

Ein herkommlicher Leistungsanalysierer erzeugt ein Ausfuhrungsprofil von einzelnen Prozessoren, welches in 
solcher Weise aufsummiert ist, daB die gesamte Verarbeitungszeit in einige Kategorien klassifiziert ist, enthal- 
tend Netto-Betriebszeit und Leerlaufzeit usw. Das Ausfuhrungsprofil jedes Prozessors wird getrennt in Form 

30 einer Balkengraphikoder ahnlichemdargestellt 

Dieses herkdmmliche Verfahren der DarsteUung von Ausfuhrungsprofilen ist jedoch fur Software-Entwick- 
lungsingenieure in keiner Weise vorteilhaft, wenn das Parallelverarbeitungssystem hunderte von Prozessoren 
enthalt Die an einem Analysierer-Bildschirm dargestellten Informationen sind zu umfangreich, um das Pro- 
grammverhalten richtig verstehen zu kdnnen, da zu viele Prozessoren parallel laufen. In einem solchen Fall kann 

as der herkommliche Analysierer die Schwierigkeit dadurch etwas mildern, indem eine gewisse statistische Verar- 
beitung hinsichtlich der gewonnen Rohdaten angewandt wird Dies erlaubt es, das Gesamtprogrammverhalten 
oder die mitdere Leistung der Prozessoren den Ingenieuren in einer verstandlicheren Art darzubietert 

Jedoch sind die Informationen, die durch diesen herkommlichen Leistungsanalysierer vorgesehen werden, fur 
die Software-Entwicklungsingenieure nicht ausreichend, um die Systemqualkat bzw. Leistung vollstandig ver- 

40 stehen zu konnen und die detaillierte Beziehung zwischen den Prozessen verstehen zu konnen, die parallel 
laufen. 

ZUSAMMENFASSUNG DER ERFINDUNG 

Unter Einbeziehung des oben gesagten, besteht eine erste Aufgabe der vorliegenden Erfindung darin, ein 
verbessertes Verfahren zur sichtbaren DarsteUung von Ergebnissen der Leistungsuberwachung und -analyse m 
einem Parallelrechnersystem zu schaffen, welches Prozentsatze der Anwender-Netto-Programmausfiilming, 
Kommunikation, Synchronisation und anderer paraUel ablauf ender Organisationsaufgaben zeigt als auch deren 
Abweichungen anzeigt 

Es ist ein weiteres Ziel der vorliegenden Erfindung, ein verbessertes Verfahren zur sichtbaren DarsteUung von 
Ergebnissen der Leistungsuberwachung und -analyse in einem Parallelrechnersystem zu schaffen, welches dem 
Anwender die Moglichkeit bietet, Software-Routinen in einem parallel verarbeitenden Programm zu bewerten, 
und zwar uber eine problemlose und vorteilhafte graphische Wiedergabe des Ausfuhrungsprofils. 

Um die genannte Aufgabe zu losen, schafft die vorliegende Erfindung ein Verfahren zur sichtbaren Darstel- 
lung von Ergebnissen der Leistungsuberwachung und -analyse in einem Parallelrechnersystem, bet dem eine 
Vielzahl von Prozessoren ein paraiieles Verarbeitungsprogramm ausfuhren, welches aus einer Vielzahl von 
Routinen zusammengesetzt ist Das Verfahren umf aBt die folgenden Schritte: 

(a) Sammeln von Informationen hinsichdich der Ausfuhrungszeit von jeder Routine, die gleichlaufend durch 
eine Vielzahl von Prozessoren ausgefuhrt wird, unter Berucksichtigung der Klassifizierung der Routinen; 

(b) Ableiten eines Maxinialwertes, eines Mittelwertes, eines Minimalwertes und einer Standardabweichung 
der Ausfuhrungszeit von jeder Routine basierend auf den Informationen, die fur die Vielzahl der Prozesso- 
ren gesammelt wurden; und 

(c) graphisches Darstellen der Ausfuhrungsprofil-Information, welche den Maximalwert, den Mittelwert 
und den Minimalwert und die Standardabweichung der Ausfuhrungszeit jeder Routine enthalt 

Um speziell das weitere Ziel, welches oben erlautert wurde, zu erreichen, wird ein Verfahren zur sichtbaren 
DarsteUung von Ergebnissen der Leistungsuberwachung und -analyse fOr ein Parallelrechnersystem geschaffen. 
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GemaB dem Verfahren werden AusfuhrungsprofU-Informationen in Form von Balkengraphiken, Kreisgraphi- 
ken oder Radarkarten dargestellt 

Weitere Ziele neben den obigen, Merkmale und Vorteile der vorliegenden Erfindung ergeben sich aus der 
folgenden Beschreibung in Verbindung mit den beigefugten Zeichnungen, die eine bevorzugte Ausfuhrungsform 
der vorliegenden Erfindung als Beispiel veranschaulichen. 5 

KURZBESCHREIBUNG DER ZEICHNUNGEN 

Fig. 1 ist eine Konzeptdarstellung eines Leistungsanalysierersystems, welches ein Sichtdarstellungsverfahren 
gemaB der voriiegenden Erfindung verwendet; io 

Fig. 2 ist ein FluBdiagramm, welches eineti ProzeB der Modifizierung und Korapilierung eines Programms 
zeigt, welches fur ein Parallelverarbeitungssystem geschrieben wurde; 

Fig. 3 ist eine Tabelle, in der Laufzeit-Subroutinen aufsummiert sind, die fur eine Leistungsuberwachung und 
-analyse vorgesehen werden; 

Fig. 4 ist ein FluBdiagramm, welches die Funktionen der Laufzeit-Subroutine # 1 beschreibt; is 

Fig. 5 ist ein FluBdiagramm, welches die Funktionen der Laufzeit-Subroutine # 2 beschreibt; 

Fig. 6 ist ein FluBdiagramm, welches die Funktionen der Laufzeit-Subroutine # 3 beschreibt; 

Fig. 7 ist ein FluBdiagramm, welches die Funktionen der Laufzeit-Subroutine #4 beschreibt; 

Fig. 8 ist ein FluBdiagramm, welches die Funktionen der Laufzeit-Subroutine # 5 beschreibt; 

Fig. 9 ist ein FluBdiagramm, welches die Funktionen der Laufzeit-Subroutine # 6 beschreibt; 20 

Fig. 10 ist ein FluBdiagramm, welches die Funktionen der Laufzeit-Subroutine # 7 beschreibt; 

Fig. 1 1 ist ein FluBdiagramm, welches die Funktionen der Laufzeit-Subroutine #8 beschreibt; 

Fig. 12 ist eine Tabelle, in der die Informationen aufsummiert sind, die durch das Leistungsanalysierersystem 
der vorliegenden Erfindung zu sammeln sind; 

Fig. 13 ist ein Diagramm, welches ein erstes Beispiel einer Ausfuhrungsprofilanzeige gemaB der vorliegenden 25 
Erfindung zeigt bei der jede Prozedur oder Schleif e skaiiert ist in bezug auf die Ausfuhrungszeit eines gesamten 
Programms; 

Fig. 14 ist ein Diagramm, welches ein zweites Beispiel der Ausfuhrungsprofildarstellung zeigt, bei der alle 
Prozeduren und Schleif en in gleicher Weise skaiiert sind, ungeachtet deren absoluter Ausfuhrungszeiten; 

Fig. 15 ist ein Diagramm, welches ein drittes Beispiel einer Ausfuhrungsprofildarstellung zeigt, in der das 30 
Ausfuhrungsprofil von jeder Prozedur oder Schleife in einer Kxeisgraphik wiedergegeben ist; 

Fig. 16 ist ein Diagramm, welches ein viertes Beispiel der AusfQhningsprofildarstellung zeigt, in der das 
Ausfuhrungsprofil in einer Radarkarte wiedergegeben ist; 

Fng. 17 ist ein Diagramm, welches ein funftes Beispiel einer Ausfuhrungsprofildarstellung gemaB der vorlie- 
genden Erfindung zeigt; und 35 

Fig. 18 ist ein Diagramm, welches ein sechstes Beispiel der Ausfuhrungsprofildarstellung gemaB der vorlie- 
genden Erfindung zeigt 

BESCHREIBUNG DER BEVORZUGTEN AUSFOHRUNGSFORM 

40 

Eine Ausfuhrungsform der vorliegenden Erfindung soil nun im folgenden unter Hinweis auf die beigefugten 
Zeichnungen beschrieben werden. 

Fig. 1 ist eine Konzeptdarstellung eines Leistungsanalysierersystems, in welchem ein Sichtbardarstellverfah- 
ren gemaB der vorliegenden Erfindung angewandt wird. Ein Paralleirechnersystem O ist durch eine Vielzahl von 
Prozessoren 112a— 12n aufgebaut die als Berechnungselemente dienen und die zusammen laufen, urn umfangrei- 45 
che Berechnungsaufgaben zu erzielen, die in einem Parallelverarbeitungsprogramm codiert sind. Solche Prozes- 
soren 12a— 12n umfassen einzeln Datensammeleinrichtungen 13a— On und eine Datensummiereinrichtung 
14a— 14n zum Korrigieren und Aufsummieren von jeweils Ausfuhrungszeitdaten. 

Die Datensammeleinrichtungen 13a— On sammeln in einer Real zeitweise die Ausfuhrungszeitdaten wahrend 
der Programmausfuhrung in den jeweiligen Prozessoren 12a— S2n, in denen sie auftreten. Die Ausfuhrungszeit- 50 
daten, die durch die Datensammeleinrichtungen 03a— On gesammelt wurden, werden als Quellendaten fur die 
Ausfuhrungsprofile verwendet Die Ausfuhrungsprofile bestehen aus einem Satz von Reports, welche die 
Anwender mit Informationen uber die Prozessoren 12a— 12n, daB diese tatsachlich arbeiten, versehen, wodurch 
diese das Programm von verschiedenen Gesichtspunkten aus bewerten konnen. 

Die Ausfuhrungsprofile weisen auf einige bestimmte Programmroutinen hin, welche das Parallelverarbei- 55 
tungsprogramm bilden, wie beispielsweise Prozeduren, Schleifen, eine parallele Verarbeitungsbibliothek, die 
durch das Leistungsanalysierersystem uberwacht und analysiert werden. In diesem Sinn werden diese Routinen 
als Subjekte der Profilbildung oder Profilsubjekte bezeichnet 

Die Datensummiereinrichtungen fl4a— 14n summieren die Ausfuhrungszeitdaten, die durch die Datensammel- 
einrichtungen Oa— On gesammelt wurdea Spezifisch gesagt berechnen sie Maximal-, Mittel-, Minimalwerte 60 
urid eine Standardabweichung der gesammelten Ausfuhnmgszeiten fur jede Routine oder jedes Subjekt fur die 
Profilbildung. Urn diese Aufgabe zu erreichen, ist es erforderlich, alle Ausfuhrungszeitdaten zu kompilieren, die 
durch die Datensammeleinrichtungen 13a— On an einer einzelnen Stelle gesammelt wurden. Daher befaBt sich 
eine der Datensummiereinrichtungen, wie beispielsweise 14a, mit den Summierungsaufgaben und andere 
14b— 14n senden einfach ihre Daten zu dieser Datensummier-Subroutine 14a unter Verwendung von Inter-Pro- 55 
zessor-Komraunikationspfaden(nichtgezeigt)indem Paralleirechnersystem 11. 

In Wirklichkeit sind die oben beschriebenen Datensammeleinrichtungen Oa— On und die Datensummierein- 
richtungen 14a— 14n in dem Paralleirechnersystem 11 in Form eines Satzes von Subroutinen implementiert, die 
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als ein Teil der LaufzeitbibUothek fur die Paralleiverarbeitung vorgeseben sind Bei der vorliegenden Ausfuh- 
rungsform stehen acht Uufzeit-Subroutinen fur diesen Zweck zur Verfugung, wie in Fig. 3 aufgehstet ist Die 
detaillierten Funktionen der Datensammeleinrichtungen Oa-Bn und der Datensummiereinnchtungen 
H4a— 14n sollen getrennt unter Hinweis auf die Fig. 4 bis 1 1 beschrieben werden. 

Um erneut auf Fig. 1 einzugehen, ist das Parallelrechnersystera 11 an zwei Datendateien gekoppelt: eine 
Quellencodedatei 115 und eine Profilinformationsdatei 16. Die Quellencodedatei 115 enthait den onginalen Quel- 
lencode eines Programms, welches durch die Prozessoren 112a- H2n ausgefuhrt werden soil Die Profilinforma- 
tionsdatei 116 speichert Ausfuhrungszeitdaten und deren Siimmendaten, wie sie von den Prozessoren 12a- 12n 
benotigt werden. m 

Ein Profilanzeigeprozessor H7 analysiert die Inhalte der Profilmformationsdatei 11(5 und stellt das Ergebnis 
dieser Analyse in einem Ausfuhrungsprofilfenster 22 auf einera Bildschirm einer Anzeigeeinheit 211 dan Hier 
macht der Profilanzeigeprozessor 17 das Ergebnis der Analyse sichtbar, und zwar unter Verwendung mehrerer 
graphischer Wiedergabetechniken, wie dies an spaterer Stelle in Verbindung mit den Kg. 13 bis 18 beschrieben 
werden soil Eine Eingabevorrichtung 18 wird dazu verwendet, um einige Bef ehle oder Daten in den Profilanzei- 
15 geprozessor!7einzugeben. 

Bei Verwendung dieser Eingabevorrichtung 18 kann der Anwender dieses Leistungsanalysierersystems einen 
spezifischen Punkt (z.B. eine Prozedur oder Schleife) bezeichnen, der in dem Ausfuhrungsprofilfenster 22 
dargestellt wird Ein Quellencode-Positionsanalysierer 19 sucht nach dem Quellencode, um die Codeposition 
(oder Zeilenzahl) entsprechend dem Punkt herauszufinden, der durch den Anwender bezeichnet worden ist 
GeraaB der Codeposition-Information, die durch den Quellencode-Positionsanalysierer 19 getf efert wird, extra- 
hiert einen Quellencode-Browser 20 den relevanten Teil des QueUencodes 15 und zeigt den extrahierten 
Quellencode in einem Quellencodefenster 23 auf dem Bildschrift der Anzeigeeinheit 21 an. 

Bevor die Programmausfuhrung bei dem oben beschriebenen System gestartet wird, ist es erforderhch, den 
onginalen Quellencode in ein ausfuhrbares Programm zu ubersetzen oder zu kompUieren. Bei der voriiegenden 
Erfindung sollte der Quellencode vor der Kompilierung modifiziert werden, und zwar fur Oberwachungs- und 
MeBzwecke. Spezifischer gesagt, schiebt das Kompiliersystem Subroutine-Ruf-Zustande in den Quellencode : ein, 
um einige Laufzeit-Subroutinen fur die Datensammiung und Summierung an geeigneten Punkten in dem 
Programm aufzuruf en. . , . _ 

Der Quellencode eines parallel verarbeitenden Programms besitzt eine hierarchische Struktur. Das Pro- 
gramm oder die Anwender-Anwendung besteht aus einer Vielzahl von Prozeduren. Eine Prozedur ruft einige 
andere Prozeduren auf; mit anderen Worten konnen Prozeduren verschachtelt werden. Als Tatsache ist der 
Hauptkdrper des Programms eine Prozedur, die implizit als "MAIN" bezeichnet wird, die mehrere Abkomm- 
lingsprozeduren enthait Die Schleife besteht aus einer Sequenz von Befehlen als TeU einer Prozedur, die iterativ 
ausgefuhrt werden. _ . 

Um die paraUe Programmausfuhrung zu unterstutzen, sieht das System erne Bibhothek von Routinen vor, um 
eine ProzeBkommunikation, Synchronisation und andere Auf gaben auszufuhren, die bei der parallelen Verarbei- 
tung inharent vorkommen. Diese werden als parallel verarbeitende Bibiiotheksroutinen bezeichnet, welche 
durch die Prozeduren nach Bedarf aufgerufen werden. Da sie die Systemleistung als parallel laufende Zusatze 
beeinflussen, sind die parallel verarbeitenden Bibiiotheksroutinen ein wichtiges Merkmal bei der Ausf uhrung der 

40 Profilbildung. , w m . _ 

Fig. 2 zeigt ein FIuBdiagramm, welches einen ProzeB der Modifizierung und Kompilierung ernes Programms 
fur das Parallelrechnersystem 1 1 zeigt Dieser ProzeB enthait die f oigenden sieben Schritte. 

[SI] Es wird der Quellencode eines parallel verarbeitenden Programms, welches in jedem Prozessor in dem 
Parallelrechnersystem 1 1 auszufuhren ist, in das Kompilienmgssystem eingegeben. 

[S2] Es wird eine Feststellung zura Aufrufen einer Laufzeit-Subroutine #1 in den Anffangsteil des Hauptpro- 
grammkorpers eingefugt Die Laufzeit-Subroutine # 1 zeichnet die Zeit auf, wenn das Programm gestartet wird. 

[S3] Es werden FeststeUungen zum Aufraf en der Laufzeit-Subroutinen #2und #3 jeweilsinden Anfangsteu 
und in den Endteil jeder Prozedur eingefugt, die in dem Quellencode enthalten ist 

[S4] Es werden FeststeUungen zum Aufrufen der Laufzeit-Subroutinen #4 und #5 jeweils m den Anfangsteu 
und in den Endteil jeder Schleife eingefugt, die in den Prozeduren enthalten ist 

[S5] Es werden FeststeUungen zum Aufrufen der Laufzeit-Subroutinen #6 und #7 jeweUs in den Anfangsteu 
und in den EndteU jeder parallel verarbeitenden BibUotheksroutine eingefugt 

[S6] Es wird eine FeststeUung zum Aufrufen der Uufzeit-Subroutine #8 in den Endteil des Hauptprogramm- 
k**rpers eingefugt 

TrSrtH^^ ubersetzt (oder kompiliert) die QueUencodedatei 15, die nun die bei den 

Schritten S2 bis S6 eingefugten Subroutine-Aufruf-FeststeUungen enthait, in den Objektcode, der durch die 
Prozessoren 12a— 12n ausfuhrbar ist . . . 

Durch Ausfuhren der oben erlauterten Schritte SI bis S7 fugt das Kompffierungssystem emige geeignete 
FeststeUungen in die QueUencodedatei 15 ein, um die Laufzeit-Subroutinen fur die Datensammiung und Aufsum- 
mierung aufzurufen und es kompiliert die QueUencodedatei 15, um den ausfuhrbaren Objektcode zu geneneren. 
Als ein Ergebnis enthait der generierte Objektcode Subroutine-Aufruf-Befehle sowohl an den Start- als ; audi 
Endpunkten des Hauptprogrammkorpers, der Prozeduren, Schleifen und der parallel verarbeitenden Bibiiot- 
heksroutinen. t t , , c „, _ 
Fig. 3 faBt die Laufzeit-Subroutinen, die zum Zweck der Leistungsuberwachung und -analyse emgefunrt 
wurden, zusammen. Die Tabelle 30 beschreibt kurz die Funktionen der acht Laufzeit-Subroutinen in deren 
jeweiiigenGelegenheiten, bei denen sie aufgerufen werden. 

Die in dieser Tabelle aufgelisteten ersten sieben Subroutinen (# 1 bis #7) smd Subroutines die zum Sammeln 
von Zeitwertzeichendaten und zum Akkumulieren der Ausfuhrungszeit von jedem Abschmtt des Parallelpro- 
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gramms ausgelegt sind Das heiBt, solche Subroutinen #1 — #7 entsprechend der Datensammeleinrichtung 
11 3a— On in Fig. 1. Die achte Subroutine #8 besteht aus einer Subroutine, die zum Summieren der Daten 
ausgelegt ist, die durch die Subroutinen #1 bis #7 gesammelt und akkumuliert wurden. Die Subroutine #8 
entspricht sorait der Datensummiereinrichtung 14a — !14il 

Ura auf die Fig. 4 bis 11 einzugehen, so das folgende hinsichtlich der detaillierten Funktionen der Laufzeit- 
Subroutinen # 1 — # 8 erlautert, die in den Quellencode eingefugt sind 

Fig. 4 zeigt ein FluBdiagramm, welches die Laufzeit-Subroutine # 1 zeigt, die dann aufgerufen wird wenn das 
Programra startet zu lauf en und die zwei folgenden Auf gaben vorsieht 

[S 1 1 a] Initialisieren eines ortlichen Datenbereiches, der zum Aufzeichnen und zum Analysieren des Prozessor- 
Verhaltens verwendet wird 

[SI 1 b] Aufzeichnen des Programmstartzeitpunktes. 

Die Fig. 5 und 6 sind FluBdiagramme, welche die Laufzeit-Subroutinen #2 bzw. #3 zeigen. Die Laufzeit-Sub- 
routine #2 wird zu Beginn von jeder Prozedur aufgerufen und wie bei dem Schritt S12a von Fig. 5 gezeigt ist, 
zeichnet sie den Ausfuhrungsstartzeitpunkt dieser Prozedur auf. Als ein Gegenstuck zu dieser Subroutine #2 
wird die Laufzeit-Subroutine #3 aufgerufen, wenn die Prozedur beendet wird und sie fuhrt die folgenden drei 
Aufgaben aus: 

[S13a] Erhalten der Ausfuhrungs-Ende-Zeit der Prozedur. 

[SI 3b] Akkumulieren der Ausfuhrungszeit der Prozedur (das heiBt Akkumulieren der Differenz zwischen der 
Ausf iihrungsstartzeit und der Ausfuhrungs-Ende-Zeit). 

[S13c] Akkumulieren der Ausfuhrungszeit von jeder parallel verarbeitenden Bibliotheksroutine, die durch die 
Prozedur aufgerufen wurde (das heiBt Akkumulieren der Differenz zwischen der Ausfuhrungsstartzeit und der 
Ausfuhrung-Ende-Zeit, die durch die Laufzeit-Subroutinen #6 und #7 fur jede parallel verarbeitende Bibliot- 
heksroutine aufgezeichnet wurde). 

Fig. 7 zeigt ein FluBdiagramm der Laufzeit-Subroutine #4, welche aufgerufen wird, wenn der Prozessor in 
eine Schleife eintritt Die Schleife umfaBt eine Folge von Befehlen, die iterativ ausgefuhrt werden, und zwar 
unter der Steuerung einer Schleifen-Zahler-Variablen. Jedesmal, wenn die Schleife ausgefuhrt wird wird die 
Schleifen-Zahler- Variable erhoht (oder vermindert), und zwar um ein vorbestimmtes Inkrement und es wird die 
Schleife wiederhoit, bis die Schleifen-Zahler- Variable einen vorgeschriebenen Grenzwert erreicht oder andere 
Beendigungsbedingungen erfuJIt sind Um statistische Ausfuhrungsdaten fur die Schleifen zu sammeln, fuhrt die 
Laufzeit-Subroutine #4 die folgenden zwei Aufgaben durch: 
[S 14a] Aufzeichnen der Ausf iihrungsstartzeit der Schleife. 

[S14b] Erhalten des Anfangswertes der Schleifen-Zahler-Variablen und des Inkrements (oder Schleifenzahler- 
SchrittgroBe) fur jede Iteration, und Aufbewahren derselben fur zukunftige Verwendung. 

Fag. 8 zeigt ein FluBdiagramm der Laufzeit-Subroutine #5, die ausgefuhrt wird, wenn eine Schleife beendet 
wird Diese fullt die folgenden vier Aufgaben fur jede Schleife. 
[S15a] Erhalten der Ausfuhrung-Ende-Zeit der Schleife. 

[S15b] Akkumulieren der Ausfuhrungszeit der Schleife (das heiBt Akkumulieren der Differenz zwischen der 
Ausfuhrungsstartzeit und der Ausfuhrung-Ende-Zeit fur die Schleife). 

[S15c] Erhalten des endgultigen Wertes der Schleifensteuer-Variablen und Berechnen der Zahl der Iterationen 
basierend auf den Anfangs- und Endwerten der Schleifen-Zahler-Variablen und der Schritt groSe. 
[S15d] Akkumulieren der Zahl der Iterationen. 

[S15e] Akkumulieren der Ausfuhrungszeit von jeder parallel verarbeitenden Bibliotheksroutine, die durch die 
SchleSfe aufgerufen wird Hier wird die Ausfuhrungszeit dadurch erhalten, indem die Ausfuhrungsstartzeit bzw. 
Ausfuhningsstartzeitpunkt von dem Ausfuhrung-Ende-Zeitpunkt subtrahiert wird die durch die Laufzeit-Sub- 
routinen #6 und #7 fur jede parallel verarbeitende Bibliotheksroutine aufgezeichnet wurden, die von der 
Schleife aufgerufen wurden. 

Die Fng. 9 und 10 zeigen die Laufzeit-Subroutinen #6 und #7, die aufgerufen werden, wenn eine parallel 
verarbeitende Bibliotheksroutine jeweils startet und endet Das heiBt, die Laufzeit-Subroutine #6 fuhrt den 
folgenden Schritt aus: 

[SI 6a] Aufzeichnen des Ausfuhnmgsstartzeitpunktes der parallel verarbeitenden Bibliotheksroutine. 

Als Gegenstuck zu dieser Laufzeit-Subroutine # 6 erzeugt die Laufzeit-Subroutine # 7 folgendes: 
[S 1 7a] Erhalten des Ausfuhrungs- Ende-Zeitpunktes der parallel verarbeitenden Bibliotheksroutine. 
[S17b] Akkumulieren der Ausfuhrungszeit der parallel verarbeitenden Bibliotheksroutine, wobei die Ausfuh- 
rungszeit die Differenz zwischen dem Ausfuhrungsstartzeitpunkt, der bei dem Schritt SI 6a aufgezeichnet wurde, 
und dem Ausfuhrung-Ende-Zeitpunkt, der bei dem Schritt S 1 7a erhalten wurde, ist 

Fig. 11 zeigt ein FluBdiagramm, welches die Laufzeit-Subroutine #8 wiedergibt, die am Ende des gesamten 
Program ms ausgefuhrt wird Die Laufzeit-Subroutine #8 summiert die Ausfuhrungszeitdaten auf, die durch die 
anderen Laufzeit-Subroutinen 4* 1 bis # 7 gesammelt wurden, und zwar gemaB den folgenden Schritten: 
[Sl8a] Berechnen der mittleren angesammelt Zeit von jeder parallel verarbeitenden Bibliotheksroutine, die 
durch jede Prozedur aufgerufen wurde, gemaB den folgenden Gleichungen: 
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Top (avg) = T °P( m ) ... (3) 



worin n eine ganze Za hi ist, welche die Anzahl der Prozessoren wiedergibt, die in dem ParaUelrechnersystem 1 1 
involviert sind und m eine ganze Zahl ist, die von 1 bis n reicht und dazu verwendet wird, um einen spezifischen 
Prozessor anzuzeigen. Tcp(m) ist die akkumulierte Ausfuhrungszeit, weiche der m'te Prozessor fur die Komrau- 
nikationsaufgaben verbraucht hat Tcp(avg) bedeutet eine mittlere angesammelte Ausfuhmngszeit, die fur 
Kommunikationsaufgaben verbraucht wurde. Twp(m) ist die akkumulierte Ausfuhmngszeit, die der m'te Pro- 
zessor fur die Synchronisation verbraucht hat Twp(avg) bedeutet eine mittlere akkumulierte Ausfuhmngszeit, 
die fur Synchronisationsaufgaben verbraucht wurde. Top(ra) ist die akkumulierte Ausfuhmngszeit, die der m'te 
Prozessor fur Auf gaben verbraucht hat, die anders sind als die Kommunikations- und Synchronisationsaufgaben. 
Top(avg) bedeutet eine mittlere akkumulierte Ausfuhrungszeit, die fur andere Aufgaben verbraucht wurde. 
15 [S18b] Berechnen des Maximalwertes, Minimalwertes und der Standardabweichung a fur jede der akkumulier- 
ten Ausfuhrungszeiten Tcp(raX Twp(m) und Top(m). 

[S18c] Berechnen der mittleren akkumulierten Ausfuhmngszeit des Anwenderprogramms gemaB der folgenden 
Gleichung: 
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worin Tpp(m) die Ausfuhmngszeit bedeutet, die durch den m'ten Prozessor fur die in Betracht stehende 
Prozedur verbraucht wurde und wobei Tup(m) die Netto- Ausfuhrungszeit des Anwenderprogramms bedeutet 

30 

Tup(m)-Tpp(m)-Tcp(m)-Twp(m)-Top(m)) (5) 

[S18d] Berechnen des Maximalwertes, des Minimalwertes und der Standardabweichung a fur die akkumulierte 
AusfQhrungszeit des Anwenderprogramms Tup(mX # . 

35 [S18e] Berechnen der mittleren angesammelten Zeit von jeder parallel verarbeitenden Bibliotheksroutme, die in 
jeder Schleife aufgerufen wurde, gemaB den folgenden Gleichungen: 



Tcl(avg) = ±j£ Tcl(m) -..(6) 

or=l 
w 

Twl (avg) = Twl(m) ...(7) 

JK=1 

n 

Tol(avg) = ■ ±£ Tol(m) .-.(8) 



Tcl(m) ist die akkumulierte Ausfuhmngszeit, die der m'te Prozessor fur Kommunikationsaufgaben bendtigt hat 
Tcl(avg) bedeutet die mittlere angesammelte Ausfuhmngszeit, die fur Kommunikationsaufgaben verbraucht 
wurde. Twl(m) ist die akkumulierte Ausfuhmngszeit, die der m'te Prozessor fur die Synchronisation bendtigt hat 
Twl(avg) bedeutet die mitdere akkumulierte Ausfuhmngszeit, die fur Synchronisationsaufgaben verbraucht 
wurde. Tol(m) ist die akkumulierte Ausfuhmngszeit, die der m'te Prozessor fur Aufgaben verbraucht hat, anders 
als die Kommunikations- und Synchronisationsaufgaben. Tol(avg) bedeutet die mittlere akkumulierte Ausfuh- 
55 ningszeit, die fur andere Aufgaben verbraucht wurde. 

[S18fj Berechnen des Maximalwertes, des Minimalwertes und der Standardabweichung a fur jede der akkumu- 
lierten Ausf uhrungszeiten Tcl(m), Twl(m) und Tol(m> 

[S18g] Berechnen der mittleren angesammelten Ausfuhmngszeit des Anwenderprogramms gemaB der folgen- 
den Gleichung: 



Tul(ave) = £]T Tul (m) 
65 = i£ (Tpl (m) -Tel (m) -Twl (m) -Tol (m) ) . . . (9) 
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worm Tpl(m) die Ausfuhrungszeit ist, die von dem ro'ten Prozessor fur die in Betracht stehende Schleife 
verbraucht wurde und Tu!(m) die akkumulierte Netto- Ausfuhrungszeit des Anwenderprogramms ist 

Tul(m)-TpI(ra)-TcI(m)-Twl(ni)-ToI(ni)) (5) 

5 

[S18h] Berechnen des Maximalwertes, des Minimalwertes und der Standardabweichung a fur die akkumulierte 
Ausfuhrungszeit des Anwenderprogramms Tul(m). 

[S18i] Ausgeben der Ergebnisse der Schritte S18a bis S18h als eine Profil-Informationsdatei IS. 

Fig. 12 zeigt eine Tabelle, die die Informationen zusammenfaBt, welche durch das Leistungsanalysierersystem 
der vorliegenden Erfindung gesammelt wurden. In dieser Tabelle 40 sind die gesammelten Informationen in to 
Einklang mit dem Subjekt der Profilierungsoperationen klassifiziert, welche Prozeduren, Schleifen und parallel 
verarbeitende Bibliotheksroutinen enthalten, um die Kommunkation, Synchronisation und andere Aufgaben zu 
unterstutzen. Obwohl in Fig. 12 nicht gezeigt, konnten bedingte Programmverzweigung auch in dem Profilsub- 
jekt enthalten sein. 

Im allgemeinen werden Informationen, welche das Programmverhalten in jedem Prozessor betreffen, an drei is 
verschiedenen Stufen der Ausfiihrung gesammelt: einer vorbereitenden Verarbeitungsstufe, einer Anlauf -Verar- 
beitungsstuf e und einer Datenverarbeitungsstufe (terminal process stage). 

Die vorbereitende Verarbeitungsstufe besteht aus einer Stufe, bevor eine bezeichnete Routine als Profiisub- 
jekt aufgerufen wird. Die drei Arten der Profil-Subjekte, die in der Tabelle 44) aufgelistet sind, erfordern es 
jedoch nicht, daB Informationen an der vorbereitenden Verarbeitungsstufe gesammelt werden. Wie oben 20 
dargelegt wurde, konnen auch bedingte Programmverzweigungen (in Fig. 7 nicht gezeigt) ein Ziel der Ausfuh- 
rungsprofilierung seia Wenn dies der Fall ist, werden zusatzliche Bef ehle in den Quellencode eingefuhrt, um eine 
andere Laufzeit-Subroutine aufzurufen, um Informationen an aktueilen Verzweigungsbedingungen zu sammeln. 
Speziell enthalten solche Verzweigungsbedingungen "Wahr- oder Falsch-*Bedingungen als Ergebnis von logi- 
schen Operationen oder "negative, Null- oder positive" Bedingungen als ein Ergebnis von arithmetischen 25 
Operationen, die vor den Verzweigungsbefehlen ausgefuhrt wurden. Die Laufzeit-Subroutine zahlt das Auftre- 
ten von jeder solcher Bedingungen, bevor eine Verzweigung durchgefuhrt wird, namiich bei der vorbereitenden 
Verarbeitungsstufe. 

Die Anlauf- Verarbeitungsstufe besteht aus einer Stufe, bei der eine Routine, die bei einem Profil-Subjekt 
beteiligt ist, zu laufen beginnt Spezieller gesagt, wird die Ausfuhrungsstartzeit an der Anlauf- Verarbeitungsstufe 30 
von jeder Prozedur (siehe S12a in Fig. 5% Schleife (siehe S14a in Fig. 7) oder parallel verarbeitenden Bibliotheks- 
routine (siehe S16a in Fig. 9) aufgezeichnet Im Falle der Schleifen wird der Anfangswert einer Schleifenzahler- 
Variablen und einer Schleifenzahler-SchrittgroBe zusatzlich zu der Ausfuhrungsstartzeit (siehe S14b in Fig. 7) 
aufgezeichnet 

Die Datenverarbeitungsstufe oder Ende- Verarbeitungsstufe besteht aus einer Stufe, bei der eine Routine 35 
dabei ist zu enden. Bei der Ende- Verarbeitungsstufe jeder Prozedur werden die Ausfuhrungszeit der Prozedur 
und die Ausfuhrungszeit von jeder parallel verarbeitenden Bibliotheksroutine, die innerhalb der Prozedur 
aufgerufen wurde, akkumuliert (siehe SI 3b und SI 3c in Fig. 6% wodurch die akkumulierten Ausfuhrungszeiten 
Tpp(m), Tcp(m), Twp(m) und Top(m) erhalten werden. In ahnlicher Weise werden bei der Ende- Verarbeitungs- 
stufe einer Schleife die Ausfuhrungszeit der Schleife und die Ausfuhrungszeit jeder parallel verarbeitenden 40 
Bibliotheksroutine, die innerhalb der Schleife aufgerufen wurde, akkumuliert (siehe St5b und St5e in F5g. 8\ 
wodurch die akkumulierten Ausfuhrungszeiten Tpl(m), Tcl(m), Twl(m) und Tol(m) fur die Schleife erhalten 
werden. Zusatzlich wird bei der Ende- Verarbeitungsstufe von jeder Schleife die Zahl der Iterationen ebenso 
akkumuliert In bezug auf die parallel verarbeitenden Bibliotheksroutinen wird die Ausfuhrungszeit von jeder 
Routine bei der Ende- Verarbeitungsstufe (siehe S 1 7b in Fig. 1 0) akkumuliert 45 

Die bei den oben beschriebenen drei ProzeBstufen gesammelten Informationen werden am Ende des Pro- 
gramms summiert und werden dann als eine Profil-Informationsdatei 116 ausgegeben. Zum Wiederauffinden der 
summierten Informationen aus der Profil-Informationsdatei 16 bietet der Profilanzeigeprozessor 117 Ausfuh- 
rungsprofilsummen dem Anwender dieses Systems an. Um den Anwender mit einer verstandlichen und informa- 
tiven Anzeige zu versehen, verwendet der Profilanzeigeprozessor 1 7 verschiedene Darstellungsverfahren, die im 50 
folgenden beschrieben werdea 

Fag. 13 zeigt ein Diagramm, welches ein erstes Beispiel der aus Ausfuhrungsprofilanzeige nach der vorliegen- 
den Erfindung veranschaulicht In diesem Fall bildet die Prozedur # 1 den Hauptkorper des unter Test stehen- 
den parallel verarbeitenden Programms und es werden die Balkengraphiken fQr die anderen Prozeduren und 
Schleifen hinsichtlich der Ausfuhrungszeit der Prozedur # 1 skaliert (das heiBt die Ausfuhrungszeit des gesam- 55 
ten Programms). 

Die Ausfuhrungsprofilanzeige, die in Fig. 13 veranschaulicht ist, enthalt Informationen hinsichtlich der Proze- 
duren # 1, #2 usw. und hinsichtlich der Schleifen # 1, #2 usw. Jede Balkengraphik ist in vier Teile eingeteilt: die 
Anwenderprogramm- Ausfuhrungszeit Tu, die JCommunikationsaufgabe-Ausfuhrungszeit Tc, die Synchronisa- 
tionsaufgabe-Ausfuhrungszeit Tw und eine andere Aufgaben- Ausfuhrungszeit To. Die Aufteilung wird durch 60 
den Profilanzeigeprozessor 17 vorgenommen, und zwar im Einklang mit Mittelwerten der angesammelten 
Ausfuhrungszeiten, 

Ferner werden die Ergebnisse der statistischen Analyse fur jede Ausfuhrungszeitkategorie auf den Balkengra- 
phiken uberlagert, wo die minimalen Werte mit einem Sternchenzeichen " ow wiedergegeben sind, die maximalen 
Werte mit einem Symbol V wiedergegeben sind und die Standardabweichungen mit einem horizontalen 65 
Liniensegment wiedergegeben sind, welches zwischen diesen gezeichnet ist 

Eine solche gerade Aus- Anzeige der Ausfuhrungsstatistiken erlaubt es dem Anwender, in einfacher Weise die 
Beziehung zwischen dem Anwenderprogramm und parallel verarbeitenden Zusatzen, inklusive Kommunika- 
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tions- und Synchronisationsaufgaben zu unterscheiden. Daruber hinaus kann der Anwender durch das Vorsehen 
der Maximum-, Minimum- und Standardabweichungssymbole auf einen Blick erkennen, in welcher Weise die 
Prozentsatze aktueil schwanken. Dieses Merkmal hilft dem Anwender sehr, das Verhalten der Prozeduren und 
Schieifen zu verstehen, die "in einem parallel verarbeitenden Programm enthalten sind, so daB dieser die 
Moglichkeit erhalt, zu beobachten, ob das Programm richtig arbeitet oder nicht und die Entscheidung treffen 
kann, ob weitere Programm-Modifikationen erforderlich sind oder nicht, um eine Qualitatsverbesserung zu 
erreichen. . . 

Fig. 14 zeigt ein Diagramm, welches ein zweites Beispiel der Ausfuhrungsprofilanzeige wiedergibt Im Gegen- 
satz zu dem ersten in Fig. 13 gezeigten Beispiel, werden bei dem Verfahren nach dem zweiten Beispiel alle 
Prozeduren und Schieifen in den individuellen ZeitmaBstaben sichtbar gemacht, ungeachtet von deren absoluten 
Ausfuhrungszeiten. Das heiBt, die Langen der Balkengraphiken sind nicht proportional zu deren jeweiligen 
Ausfuhrungszeitiangen. Die Graphiken in Fig. 14 erlauben es jedoch, daB der Anwender auf einfache Weise die 
Prozentsatze der Programmkomponenten verstehen kann (das heiBt Anwenderprogramm Tu, Kommunika- 
tionsaufgabe Tc, Synchronisationsaufgabe Tw und andere Aufgaben To), die in jeder Prozedur oder Schleife 

t5 involviertsind. . 

Fng. 15 zeigt ein drittes Beispiel einer Ausfuhrungsprofilanzeige, bei der zwei Prozeduren # 1 und #2 in Form 
einer Kreisgraphik wiedergegeben sind. Kreisgraphiken erlauben im allgemeinen, daB der Anwender die Bezie- 
hung von Komponenten zu einer Gesamtheit einfacher vergleichen kann. Bei diesem dritten Anzeigeverfahren 
zeigt ein gesamter Kreis von 360 Grad die gesarate akkumulierte Ausfuhrungszeit einer Prozedur oder Schleife 
und vier Sektoren zeigen die Prozentsatze der Anwenderprogramm-Ausfuhrungszeit (Tu), der Kommunika- 
tionsaufgabe-Ausfuhrungszeit (Tc\ der Synchronisationsaufgabe-Ausfuhrungszeit (Tw) und der anderen Aufga- 
be- Ausfuhmngszeit (To) an. 

Fig. 16 zeigt ein viertes Beispiel einer Ausfuhrungsprofilanzeige, bei der das Ausfuhrungsprofil in Form emer 
Radarkarte wiedergegeben isL Die Radarkarte in Fng. 16 besitzt vier Achsen entsprechend den vier Prograram- 
komponenteiL Die akkumulierten Ausf Qhrungszeitwerte (Tu, Tc, Tw und To) der Programmkomponenten sind 
auf deren jeweiligen Achsen aufgetragen und die aufgetragenen Punkte sind miteinander verbunden, um ein 
Polygon zu bildea Aus der Gestalt dieses Polygons kann der Anwender intuitiv die Eigenschaften der Prozedur 
oder Schleife verstehen, die in einer Radarkarte proffliert sind. . 
Ahnlich den anderen Anzeigeverfahren, die soweit beschrieben wurden, umfaBt die Radarkarte, die in Fig. 16 
30 veranschaulicht ist, Informationen hinsichtlich der Minimal- und Maximalwerte und der Standardabweichung 
der akkumulierten Ausfuhrungszeit Dieses Merkmal ermoglicht es dem Anwender, das Verhalten jeder Pro- 
grammkomponente in einem detaillierteren Wert zu verstehen. 

F3g. 17 zeigt ein funftes Beispiel einer Ausfuhrungsprofilanzeige gemaB der vorliegenden Erfindung. Ein 
Ausfuhrungsprofilfenster 5® besteht aus vier Abschnitten 5©a bis 50d Der erste Abschnitt 50a enthalt die 
35 Legende der Balkengraphiken, die in den anderen Abschnitten des Fensters 50 dargestellt sind. Spezieller gesagt, 
definiert die Legende die Farbklassifizierung fur vier verschiedene Programmkomponenten, die bezeichnet sind 
mit: 

Anwender: Anwenderprogramm. 
Com: Kommunikationsaufgabe-Routine. 
40 Sync: Synchronisationsaufgabe-Routine. 
Runlib und Gop: andere Routinen. 

Das Ausfuhrungsprofilfenster 50 bei dem funften Beispiel verwendet diese Farbklassifizierung zusammen mit 
dem Darstellungsverf ahren wie in Fig. 13. 

Der zweite Abschnitt 50b des Ausfuhrungsprofilfensters 50 zeigt ein prozedur-gestutztes Ausfuhrung^pror^ 
45 welches die akkumulierten Ausfuhrungszeiten von mehreren Prozeduren, wie beispielsweise "MAIN", "cald", 
w calc2", "cputim" und 1nitaL B , aufsummiert * 

Der dritte Abschnitt 50c des Ausfuhrungsprofilfensters 50 zeigt ein fang-gestutztes (caller-based) Ausfuh- 
rungsprofil, welches die akkumulierte Ausfuhrungszeit von jeder Prozedur zusammen mit dem Namen yon 
dessen Fang-Routine (caller routine) zusammenfaBt Beispielsweise liest sich die oberste Zeile dieses Abschnitts 
50 wie folgt: 

calcl < 1032s > MAIN < UNSPECIFIED 



55 
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worm das links bezeichnete "calcl" der Name der Prozedur ist, die durch eine Fang-Routine "MAIN" gerufen 
wurde. Das am weitesten rectus gelegene Zeichen" < UNSPECIFIED* bedeutet, daB die Fang-Routine nicht 
ihren eigenen Programmnamen deklariert und der inharente Name "MAIN" durch das Analysierersystem 
verwendet wird Die Zeile zeigt auch an, daB die akkumulierte Ausfuhrungszeit dieser Prozedur "calcl" gleich 
10,292 SekundenbetragL . 

Die Balkengraphik fur diese "calcr-Prozedur ist farb-klassifiziert gemaB der Legende, die m dem ersten 
Abschnitt 50a definiert ist, wobei vier Teile der Balkengraphik jeweils die akkumulierten Ausfuhrungszeiten Tu, 
Tc Tw und To zeigt, und zwar zusammen mit der Anzeige des Minimums, Maximums und der Standardabwei- 
chung. 

Der vierte Abschnitt 50d des Ausfuhrungsprofilfensters 50 zeigt ein rufer-gestutztes Ausfuhrungsprofil. 
Beispielsweise liest sich die oberste Zeile des Abschnitts 50d wie folgt: 

MAIN < UNSPECIFIED inital 

worin die Angabe "MAIN < UNSPECIFIED" den Namen einer Rufer-Routine zeigt und die andere Aufschrift 
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InitaT den Namen einer gerufenen Prozedur anzeigt Die Balkengraphik fur diese "initaT-Prozedur ist farb-klas- 
sifiziert gemaB der in dera ersten Abschnitt 50a definierten Legende. Sie besteht aus vier Teilen, die jeweils die 
akkumulierten Ausfuhrungszeiten Tu, Tc, Tw und To als auch deren Minimum- und Maximumwerte und 
Standardabweichung mit den zuvor erwahnten Symbolen zeigen. 

Fig. 18 zeigte ein sechstes Beispiel der AusfuJirungsprofildarstellung gemaB der vorliegenden Erfindung. Ein 5 
Ausfiihrungsprofilfenster 60 besteht aus vier Abschnitten 60a bis 60d Der erste Abschnitt 60a liefert die 
Legende von Balkengraphiken, die in den anderen Abschnitten des Fensters 60 dargestellt werden und spezieiler 
definiert ist die Farbklassifikation fur vier Programmkomponenten, die bezeichnet sind mit: 
Anwender: Anwenderprogramm. 

Com: Kommunikationsaufgabe-Routine. 10 
Sync: Synchronisationsaufgabe- Routine. 
Runlib und Gop: andere Routinen. 

Die Legende umfaBt auch die Farbklassifizierung fur Verzweigungsbedingungen, die enthalt "Wahr*- und 
Talsch ff -Bedingungen fur logische Operationen und "negative" "Null- 1 * und "positive" Bedingungen fur arithmeti- 
sche Operationen- is 

Der zweite Abschnitt 60b des Ausfuhrungsprofilfensters 60 zeigt ein Ausfuhrungsprofii, welches die akkumu- 
lierten Ausfuhrungszeiten fur mehrere SchJeifen zusammenf aBt 

Der dritte Abschnitt 60c des AusfOhrungsprofilfensters 50 zeigt ein Ausfuhrungsprofii, welches die Verzwei- 
gungsbedingungen zusammenfaBt Die obere Balkengraphik in dem dritten Abschnitt 60c veranschaulicht die 
Prozentsatze von "Wahr^-Bedingungen und Talsclf-Bedingungen, die tatsachlich als ein Ergebnis der logischen 20 
Operationen aufgetreten sind Die hintere Balkengraphik veranschaulicht die Prozentsatze von "positiven", 
"Null-" und "negativen" Bedingungen, die tatsachlich als ein Ergebnis der arithmetischen Operationen aufgetre- 
ten sind 

Der vierte Abschnitt 16d des Ausfuhrungsprofilfensters 60 liefert ein gerufenen-gestutztes (caller-based) 
Ausfuhrungsprofii, welches das gleiche ist wie bei dem dritten Abschnitt 50c in Fig. 17. 25 

Zusammenfassend fur die Fig. 12 bis 17 gibt die vorliegende Ausfuhrungsform die Ergebnisse der Leistungs- 
analyse wieder, und zwar unter Verwendung einer Vielfalt von Darstellungsverf ahren. Neben der Mogiichkeit, 
die mittlere Ausfuhrungszeit von jeder Subjekt- Routine darstellen zu konnen, zeigt das vorliegende Analysierer- 
system die Maximum-, Minimum- und Standardabweichung der Ausfuhrungszeiten, wodurch der Anwender die 
Mogiichkeit erhalt, mit einem Blick zu erkennen, wie die Prozentsatze tatsachlich schwanken. 30 

Bei der vorliegenden Ausfuhrungsform analysiert das Leistungsanalysierersystem das Parallelrechnersystem 
11 (siehe Fig. 1), welches aus vielfachen Prozessoren # 1 bis #n besteht Jedoch kann die vorliegende Erfindung 
auch auf ein einzelnes Prozessorsystera angewandt werden, welches vielfache Aufgaben ausfuhrt, und zwar 
durch Verwendung eines Zeitteilungsverfahrens. In diesem Fall sammeln mehrere geeignete Laufzeit-Subrouti- 
nen Ausfuhrungsdaten fur einzelne Prozesse oder Module, welche virtuell parallel Iaufen und das Leistungsana- as 
lysierersystem summiert die gesammelten Daten auf und stellt die Ergebnisse als Ausfuhrungsprofile dan Wie 
bei der vorhegenden Ausfuhrungsform zeigt das Ausfuhrungsprofii, welches auf einem Bildschirm dargestellt 
wird, mittlere, Minimum- und Maximum- Ausfuhrungszeiten und die Standardabweichung von dem Mittelwert 
hinsichtlich der Subjektprozesse oder Module. 

Die vorangegangene Beschreibung dient lediglich der Veranschaulichung der Prinzipien der vorliegenden 40 
Erfindung. Da ferner vielfaltige Modifikationen und Anderungen fur den Fachmann offensichtlich sind, ist nicht 
beabsichtigt, die Erfindung auf die exakte Konstruktion und Anwendungen zu beschranken, die beschrieben 
wurden, und demzufolge fallen alle geeigneten Modifikationen und aquivalenten Ausfuhrungen in den Rahmen 
der Erfindung gemaB den anhangenden Anspruchen und deren AquivaJente. 

45 

Patentanspruche 

1. Verfahren zur sichtbaren Darstellung von Ergebnissen einer Leistungsuberwachung und -analyse fur ein 
Parallelrechnersystem, bei dem eine Vielzahl von Prozessoren ein parallel verarbeitendes Programm aus- 
fuhren, welches aus einer Vielzahl von Routinen zusammengesetzt ist, wobei das Verfahren die folgenden so 
Schritte umfaBt: 

(a) Sammeln von Informationen hinsichtlich der Ausfuhrungszeit von jeder Routine, die gleichlaufend 
durch eine Vielzahl von Prozessoren ausgefuhrt wird, unter Berucksichtigung der Klassifizierung der 
Routinen; 

(b) Ableiten eines Maximalwertes, eines Mittelwertes, eines Minimalwertes und einer Standardabwei- 55 
chung der Ausfuhrungszeit von jeder Routine basierend auf den Informationen, die fur die Vielzahl der 
Prozessoren gesammelt wurden; und 

(c) graphisches Darstellen der Ausfuhrungsprofil-Information, welche den Maximalwert, den Mittel- 
wert und den Minimalwert und die Standardabweichung der Ausfuhrungszeit jeder Routine enthalt 

2 Verfahren nach Anspruch 1, bei dem bei dem Schritt (a) die Ausfuhrungszeit von jeder Routine akkumu- bo 
liert wird, jedesmal, wenn die Routine aufgerufen und ausgefuhrt wird 

3. Verfahren nach Anspruch 1, bei dem bei dem Schritt (a) die Ausfuhrungszeit von jeder Routine gesam- 
melt wird die als ein Subjekt der Profilierung bezeichnet wurde. 

4. Verfahren nach Anspruch 1 F bei dem bei dem Schritt, (a) die Routinen in ein Anwenderprogramm, 
Kommunikationsaufgaben, Synchronisationsaufgaben und andere Aufgaben klassifiziert werden. 65 

5. Verfahren nach Anspruch 3, bei dem das Subjekt der Profilierung Prozeduren, Schleifen und parallel 
verarbeitende Bibliotheksroutinen enthalt 

6. Verfahren nach Anspruch I, bei dem bei dera Schritt (b) ferner die Standardabweichung der Ausfuhrungs- 
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zeit von jeder Routine zusatzlich zu dem Maximalwert, dem Mittelwert und dem Minimalwert berechnet 
wird. 

7. Verfahren nach Anspruch 1, bei dem bei dem Schritt (c) Rufer-Routinen und/oder Gerufener-Routinen 
aus den Routinen in dem parallel verarbeitenden Programm extrahiert werden und die Ausfuhrungsprofil- 
information, welche zu den extrahierten Routinen gehort, dargestellt wird 

8. Verfahren nach Anspruch i, bei dem bei dem Schritt (c) eine Balkengraphik verwendet wird, urn graphisch 
die Ausfulirungsprofilinformation von jeder Routine darzustellen. 

9. Verfahren nach Anspruch 1, bei dem bei dem Schritt (c) eine Kreisgraphik verwendet wird, um graphisch 
die Ausf uhrungsprofilinfonnation von jeder Routine darzustellen. 

10. Verfahren nach Anspruch 1, bei dem bei dem Schritt (c) eine Radarkarte verwendet wird, um die 
Ausfuhrungsprofilinformation von jeder Routine graphisch darzustellen. 

1 1 . Verfahren nach Anspruch 1, welches f erner die folgenden Schritte umf a6t : 

(d) Annehmen einer Bezeichnung eines Punktes der AusfuhruiigspronUmformation, die bei dem Schritt 
(c) dargestellt wird, und 

(e) Darstellen eines Teiles des QueUencodes des parallel verarbeitenden Programms, welches dem 
bezeichneten Punkt der Ausfuhrungsprofilinfonnation entspricht 

12 Ein computer-lesbares Medium, welches mit einem Computer-Programm codiert ist, bei dem das 
Verfahren nach Anspruch 1 implementiert ist 

Hierzu 18 Seite(n) Zeichnungen 
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